Méthodes d’apprentissage faiblement supervisé : arbres de décision et classification itérative

نویسندگان

  • R. Lefort
  • R. Fablet
  • J. M. Boucher
چکیده

This paper addresses the probabilistic classification trees training and test for weakly labelled data. We call "weakly labelled data", training set such as the prior labelling information provided refers to vector that indicates the probabilities for instances to belong to each class. Classification tree typically deals with hard labelled data, in this paper a new procedure is suggested in order to train a tree from weakly labelled data. Considering a random forest, we show how trees can be associated in the test step. An iterative classifier based on the tree is proposed too. The aim is to develop a procedure that modifies the label in order to extract a class. The proposed methods are compared with typical models such as generative and discriminative methods for object recognition and. The considered models are evaluated on standard datasets from UCI and an application to fisheries acoustics is considered.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Apprentissage de métrique appliqué à la classification de textes par méthodes à noyaux

Résumé – Dans cet article, nous proposons une méthode pour l’optimisation de la métrique d’un classifieur textuel à noyaux. Contrairement aux techniques populaires existantes, notre approche ne nécessite pas la définition explicite de règles sémantiques. Etant donné un ensemble d’apprentissage, l’algorithme proposé permet d’optimiser la matrice sémantique, sans qu’il soit nécessaire d’exhiber c...

متن کامل

Classement d'objets incomplets dans un arbre de décision probabiliste

Résumé. Nous présentons une approche probabiliste pour déterminer les valeurs manquantes des objets incomplets pendant leur classement dans les arbres de décision. Cette approche est dérivée de la méthode d’apprentissage supervisé appelée Arbres d’Attributs Ordonnés proposée par Lobo et Numao en 2000, qui construit un arbre de décision pour chacun des attributs, selon un ordre croissant en fonc...

متن کامل

Apprentissage de la structure des processus de décision markoviens factorisés pour l’apprentissage par renforcement

Des algorithmes de planification récents issus de la théorie de la décision sont capables de trouver des politiques optimales ou quasi-optimales sur des problèmes de grande taille en utilisant le formalisme des processus de décision markoviens factorisés (FMDPs). Cependant, ces algorithmes ont besoin d’une connaissance a priori de la structure des problèmes qu’ils résolvent. Dans cette contribu...

متن کامل

Méthodes à noyaux appliquées aux textes structurés

Résumé. Cet article ébauche un état de l’art sur l’utilisation des noyaux pour le traitement des données structurées. Les applications modernes de la fouille de données sont de plus en plus confrontés à des données structurées, notamment textuelles. Les algorithmes d’apprentissage doivent donc être capables de tirer parti des informations apportées par la structure, ce qui pose d’intéressants p...

متن کامل

Sous-échantillonnage topographique par apprentissage semi-supervisé

Résumé. Plusieurs aspects pourraient influencer les systèmes d’apprentissage existants. Un de ces aspects est lié au déséquilibre des classes dans lequel le nombre d’observations appartenant à une classe, dépasse fortement celui des observations dans les autres classes. Dans ce type de cas assez fréquent, le système d’apprentissage a des difficultés au cours de la phase d’entraînement liées au ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2009